Fortalecimiento de benchmarks de agentes con bucles hacker-fixer Descubre cómo el bucle hacker-fixer protege benchmarks de agentes contra reward hacking, eliminando el 100% de exploits en KernelBench. Una solución 2026-06-16 · 2 min